Обзор процессора Intel Core i7-920
Intel Core i7
Ни для кого не будет новостью, что Intel выпускает по линейке новых процессоров для десктопов ровно раз в год. Такова политика компании. Причем выпускается новая серия одним из двух подходов: либо производство Intel переходит на новый технологический процесс, либо компания меняет архитектуру новых процессоров. Так, в 2007 году Intel перевела свое производство на 45-нм процесс (процессоры на ядрах Yorkfield и Wolfdale, они же торговая марка Core 2). В 2008 году Intel не стала проводить феерические по затратам операции по переходу на новый техпроцесс (хотя, если верить президенту нижегородского филиала Intel Владимиру Богданову, — такие технологии у intel есть), а пошла чуть менее затратным путем смены архитектуры Core 2. Результатом таких изменений стал новый процессор на базе измененного ядра Core с кодовым именем Nehalem. А у нас в редакции на протяжении пожалуй уже шести месяцев находится серийный образец, носящий имя Core i7 920, выполненный на ядре Bloomfield (отличается от классической архитектуры Nehalem встроенным контроллером памяти). Идея встраивать контроллер памяти в процессор на рынке не нова -впервые ее применила AMD, добившись от процессоров ощутимого прироста производительности. Но не только контроллером DDR III примечателен Core i7 920(да и вообще всё семейство Nehalem). Архитектура процессора приобрела также абсолютно инновационную модульную структуру, содержащую новое вычислительное ядро, новую процессорную шину, потенциальную возможность интеграции GPU. А также новую технологию мульти поточности — SMT, и контроллер, отвечающий за управление напряжением и частотой каждого из ядер Core i7 (Power Control Unit, PCU). Кроме того, при отсутствии нагрузки PCU способен вообще отключать неиспользуемые ядра Core i7.
Для чего потребовались подобные ухищрения? Причин несколько.
Во-первых, процессоры на архитектуре Core 2 сложно масштабировались. Напомним, что изначально Intel планировала выпускать под маркой Core только двухядерные процессоры. И когда возникла необходимость в использовании четырёх ядер -единственно верным решением было объединить в один корпус два двухядерных кристалла. Которые нужно было как-то заставить взаимодействовать друг с другом. Что привело к появлению в процессорах Core 2 Quad процессорной шины Quad Pumped Bus (QPB). Которая не позволяла производить обмен между ядрами процессора напрямую, а также не показала должную пропускную способность, необходимую для следующих поколений многоядерных процессоров. За что и была отправлена инженерами Intel в анналы истории, уступив место более прогрессивной процессорной шине QPI (Quick Path Interconnects), реализованной на топологии point-to-point (не путать см peer-2-peer, это совсем из другой оперы, и относится к торрентам!). Данные в QPI передаются по двум соединениям шириной в 20 бит каждое, при этом 16 из них предназначены исключительно для передачи данных. А в итоге пропускная способность шины QPI приближается вплотную к способности небезызвестной шины HyperTransport v3.0, достигая пикового значения в 25Гбит/сек.
Кристалл Core i7
Во-вторых, для обеспечения нормальной работы Core i7 потребовалось серьезно переработать кеш-память L2, т.к. одна большая разделяемая кеш-память L2 (к примеру, у процессорного ядра Penryn) не справлялась с возлагаемыми на нее объемами данных достаточно быстро. Вместо этого инженеры Intel оснастили каждое из ядер Core i7 собственным L2-кешем объемом в 256 кб. При этом размер кеша L1 в Core i7 не изменился, его объем по прежнему составляет 64кб (32кб -под данные и 32 кб -под процессорные инструкции).
Кстати, одного кеша L1 и кеша L2 инженерам показалось обоснованно маловато, поэтому Core i7 (как и всё семейство Nehalem) оснастили разделяемой кэш-памятью третьего уровня объемом 8 Мб. По крайней мере, в Core i7 920 этот кеш присутствует однозначно.
И, наконец, самое важное изменение архитектуры процессоров Nehalem — модульная структура, позволяющая изменять параметры процессоров более чем вольно. Так, буквально совсем недавно был анонсирован процессор со встроенным GPU (для Intel это инновация, встроенный графический процессор применялся ранее только в Sony Cell, рассчитанном исключительно на игровую консоль PlayStation 3), ну а Core i7 920 содержит встроенный контроллер трехканальной памяти DDR 3.
Стандартно память DDR 3 у нас теперь трехканальная
Кроме всего вышеперечисленного, незначительным изменениям подверглось само вычислительное ядро Core i7. Во взятом за основу ядре Core изменили декодеры простых и сложных команд. Плюс улучшили технологию Macrofusion (отвечающую за использование режимов x32 или x64 и выполняющую до пяти процессорных команд как единую инструкцию), оптимизировали блоки Loop Stream Detector и Stack Buffer (предсказание перехода). А для технологии Simultaneous MultiThreading (SMT) увеличили объем буферов Reorder Buffer и Reservation Station.
Simultaneous MultiThreading — сама по себе интересная технология. Она представляет из себя логическое развитие отложенной до появления Core технологии HyperThreating (HT, распараллеливание процессов), используемой в первых процессорах Intel Pentium IV. Напомним, что визуально для пользователя включение технологии HyperThreating выражалось в отображении удвоенного количества процессоров и незначительном приросте производительности в оптимизированных под технологию приложениях. В случае же использования неоптимизированного ПО можно было заметить строго противоположный результат. Рынок разработчиков ПО для настольных компьютеров воспринял новую технологию очень вяло, в результате чего Intel отложила HT "на полку". Но не прошло и пяти лет, как технология была переработана и возрождена в Core i7 под названием SMT.
Восемь ядер Core i7, из которых только 4 -реальные
Но вернемся к лежащему на тестовом столе экземпляру Core i7. Первый минус всего этого многообразия в маленьком кристалле проявился сразу же -невозможность поместить это все в старом корпусе Core 2 и, следовательно, смена сокета под процессор на материнской плате. Выводов на материнской плате теперь будет 1366 (сокет LGA-1366).
Вот ты какой, сокет LGA 1366!
Для материнских плат под Core i7 потребовался новый референс-дизайн и чипсет, получивший название Intel X58. И материнские платы на чипсете X58 оснащены минимум тремя слотами DIMM DDR 3. Стандартное же количество слотов памяти на платах с чипсетом X58 (например, на плате Foxconn Renaissance X58 Digital Life) -шесть.
Foxconn Renaissance X58 Digital Life оснащен шестью слотами DIMM для памяти DDR III
Вернемся к нашему Core i7. Упомянутый нами выше блок PCU тесно связан с технологией Turbo Boost, которая также управляет частотами ядра, но "в обратную сторону" — на повышение частоты. Естественно, что изменение частоты осуществляется программно через изменение множителя на единицу от штатного (это строгое аппаратное ограничение Core i7). Вот как это смотрится с точки зрения конечного пользователя Core i7:
Intel Core i7-920 со включенным TurboBurst. Задирание множителя на единицу от стандартного дает прирост производительности
Сравнение ядер Core i7 и Core2Duo можно свести в следующую таблицу:
Параметры ядра |
Core i7 |
Core2Duo / Core2Quad |
Техпроцесс выпуска |
45 нм |
45 нм |
Число ядер / кристаллов |
4/1 |
4/2 |
Поддержка мульти поточности |
SMT |
— |
Контроллер памяти |
3-канальный DDR3 |
— |
Кэш L1 |
64 кб (32кб+32кб) |
64 кб (32кб+32кб) |
Кэш L2 |
4 х 256 кб |
2 х 6 Мб |
Кэш L3 |
8 Мб |
— |
Тип шины/ частота |
QPI / 133 МГц |
QPB/ 266, 333 или 400 МГц |
Пакет TDP |
130 Вт |
130 Вт |
Сокет |
LGA 1366 |
LGA 775 |
Поддержка SSE |
SSE 4.1, SSE 4.2 |
SSE 4.1 |
Площадь ядра (кв. мм) |
263 |
2 x 107 |
Кол-во миллионов транзисторов |
731 |
2 x 410 |
Управление питанием/частотой |
Speed Step, PCU, TurboBurst |
Speed Step |
Ассортимент же предлагаемых в продаже процессоров Core i7 на сегодняшний день таков:
Наименование |
Core i7 920 |
Core i7 940 |
Core i7 965 Extreme Edition |
Количество ядер |
4 |
4 |
4 |
Поддержка SMT |
+ |
+ |
+ |
Частота |
2,66 ГГц |
2,93 ГГц |
3,20 ГГц |
Множитель |
20 |
22 |
24 |
Шина (QPI) |
4,8 GT/s |
4,8 GT/s |
6,4 GT/s |
Поддержка памяти |
DDR3-800/1066 |
DDR3-800/1066 |
DDR3-800/1066/1333/1600 |
Тепловой пакет (TDP, Ватт) |
130 |
130 |
130 |
Рекомендуемая цена |
$ 284 |
$ 562 |
$ 999 |
В подобных коробках продаются в России "боксовые" версии Intel Core i7-920
Из таблицы хорошо видно что наш Core i7 920 — самый маломощный процессор в новой линейке Intel Core. Тем более интересно протестировать его параллельно с четырехядерным процессором из линейки Core2Quad. Например, с Core 2 Quad QX9650.
Тестируем производительность Core i7 920 по сравнению с Core 2 Quad QX9650
При тестировании мы ставили следующие цели:
- Узнать, как смена архитектуры с Core2Quad на Core i7 повлияла на общую производительность системы.
- Узнать, насколько быстрее станет работать Core i7 920 сов ключенным режимом TurboBurst.
- Понять, как в реальности трехканальный доступ к памяти улучшит быстродействие системы.
Было собрано два тестовых стенда, аналогичных тем, которые год назад собирали коллеги из 3DNews при тестировании инженерного образца Intel Core i7-920:
Материнская плата |
ASUS P5E64 WS Evolution (Intel X48) |
ASUS P6T Deluxe (Intel X58) |
Процессор |
Core 2 Quad QX9650 |
Core i7 920 |
Кулер |
Gigabyte G-Power |
Gigabyte G-Power |
Видеокарта |
ASUS 8800 GT PCI-X |
ASUS 8800 GT PCI-X |
Звуковая карта |
Нет |
Нет |
HDD |
Samsung HD160JJ |
Samsung HD160JJ |
Память |
3×1024 Мб Qimonda DDR3-1333 |
3×1024 Мб Qimonda DDR3-1333 |
Корпус |
нет |
нет |
Блок питания |
FSP 550 Вт |
FSP 550 Вт |
OS |
Microsoft Windows Vista Home Premium |
Microsoft Windows Vista Home Premium |
Драйверы видео |
nVIDIA ForceWare 186.17 WHQL |
nVIDIA ForceWare 186.17 WHQL |
Драйверы чипсета |
Intel inf 10.0.0.10 |
Intel inf 10.0.0.10 |
Да, Вы правильно удивились -корпуса для тестирования мы не использовали. В качестве тестового стенда использовалось шасси от корпусов COLORSit, при этом с рамы были сняты все крышки. А блок питания вообще лежал отдельно от компьютера.
Итак, закончив пояснения, приступим к тестированию Core i7 920.
В синтетическом тесте Everest Memory система оборудованная Core i7 920 показала как минимум 40% прирост быстродействия по отношению к Intel Core2Quad Q9650 при копировании блока в пределах оперативной памяти, 20% превосходства по операции записи в память и увеличенное на 30-35% быстродействие при чтении из памяти. Что не удивительно, учитывая интегрированный в Core i7 920 контроллер памяти DDR 3.
Результаты тестирования Intel Core i7 в Everest PRO
Тесты 3DMark 03 и 3DMark 06 оказались не настолько суровы, как тесты программой Everest, здесь отличие в бытсродействии Core i7 920 от Core2Quad QX9650 практически незаметно. Но оно есть.
В тестах игровыми программами ситуация оказалась примерно такой же. Совсем незначительной оказалась разница в игре Company of Heroes (при том, что все тесты запускались на средних установках с кастомизацией), но тут отстутствие разницы можно списать на неоптимизированный движок игры. Значительная разница видна в Quake 4 и Serious Sam 2.
Далее мы протестировали систему с Core i7 920 и Core2Quad QX9650 на предмет работоспособности с прикладным ПО. При этом, прикинув, с чем реально может работать среднестатистический покупатель Core2Quad и Core i7, мы не стали проводить синтетически тесты типа CineBench и POV, а перешли сразу к работе с мультимедиа и данными, т.е. к кодированию видео в DivX/Xvid и сжатию данных в WinRAR (использовалась версия 3.71).
Кодирование видео мы замеряли в секундах, а значит наименьший результат является лучшим, тогда как архивирование замеряли в Кб/сек, т.е. тут наилучшим считается уже больший результат. "Итого" можно наблюдать на графиках ниже.
Выводы: Core i7 — выдающаяся разработка Intel, но не более того?
В целом Core i7 920 выигрывает по результатам тестов у Core2Quad QX9650. Наилучшие результаты Core i7 показал в приложениях, изначально оптимизированных под распараллеливание потоков и не в последнюю очередь за счет технологии SMT. А учитывая интегрированный в процессор контроллер памяти DDR 3, весьма ожидаемыми были результаты тестирования с ПО, скорость работы которого зависит напрямую от пропускной способности памяти.
Режим TurboBurst дает прибавку в скорости выполнения на Core i7 920 большинству приложений.
Минусом миграции на Core i7 и материнскую плату с чипсетом Intel X58 является высокая цена. Набор процессор + память + материнская плата обойдется даже по самым скромным подсчетам не менее чем в 28 000 — 35 000 рублей. А учитывая, что на том же Nehalem в итоге будет построен процессор Core i5, который значительно дешевле Core i7, но при этом практически не уступает последнему по производительности — переходить на систему с soket LGA-1366 нам кажется неразумным. Core i7, несомненно, является выдающейся на сегодняшний день разработкой инженеров Intel, но массовой продукцией процессоры Core i7 так и не станут. Слишком дорого и специфично.
При создании статьи использовались материалы сайта 3DNews